智能论文笔记

ReViSe: Remote Vital Signs Measurement Using Smartphone Camera

Donghao Qiao , Amtul Haq Ayesha , Farhana Zulkernine , Raihan Masroor , Nauman Jaffar

分类：计算机视觉 | 机器学习

2022-06-13

远程光插图学（RPPG）是一种快速，有效，廉价和方便的方法，用于收集生物识别数据，因为它可以使用面部视频来估算生命体征。事实证明，远程非接触式医疗服务供应在COVID-19大流行期间是可怕的必要性。我们提出了一个端到端框架，以根据用户的视频中的RPPG方法来衡量人们的生命体征，包括心率（HR），心率变异性（HRV），氧饱和度（SPO2）和血压（BP）（BP）（BP）用智能手机相机捕获的脸。我们以实时的基于深度学习的神经网络模型来提取面部标志。通过使用预测的面部标志来提取多个称为利益区域（ROI）的面部斑块（ROI）。应用了几个过滤器，以减少称为血量脉冲（BVP）信号的提取的心脏信号中ROI的噪声。我们使用两个公共RPPG数据集培训和验证了机器学习模型，即Tokyotech RPPG和脉搏率检测（PURE）数据集，我们的模型在其上实现了以下平均绝对错误（MAE）：a），HR，1.73和3.95 BEATS- beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-s-s-s-s-s-y-peats-beats-beats-beats-ship-s-s-s-in-chin-p-in-in-in-in-in-c--in-in-c-le-in-in- -t一下制。每分钟（bpm），b）分别为HRV，分别为18.55和25.03 ms，c）对于SPO2，纯数据集上的MAE为1.64。我们在现实生活环境中验证了端到端的RPPG框架，修订，从而创建了视频HR数据集。我们的人力资源估计模型在此数据集上达到了2.49 bpm的MAE。由于没有面对视频的BP测量不存在公开可用的RPPG数据集，因此我们使用了带有指标传感器信号的数据集来训练我们的模型，还创建了我们自己的视频数据集Video-BP。在我们的视频BP数据集中，我们的BP估计模型的收缩压（SBP）达到6.7 mmHg，舒张压（DBP）的MAE为9.6 mmHg。

translated by 谷歌翻译

Bengali Handwritten Digit Recognition using CNN with Explainable AI

Md Tanvir Rouf Shawon , Raihan Tanvir , Md. Golam Rabiul Alam

分类：计算机视觉 | 机器学习

2022-12-23

Handwritten character recognition is a hot topic for research nowadays. If we can convert a handwritten piece of paper into a text-searchable document using the Optical Character Recognition (OCR) technique, we can easily understand the content and do not need to read the handwritten document. OCR in the English language is very common, but in the Bengali language, it is very hard to find a good quality OCR application. If we can merge machine learning and deep learning with OCR, it could be a huge contribution to this field. Various researchers have proposed a number of strategies for recognizing Bengali handwritten characters. A lot of ML algorithms and deep neural networks were used in their work, but the explanations of their models are not available. In our work, we have used various machine learning algorithms and CNN to recognize handwritten Bengali digits. We have got acceptable accuracy from some ML models, and CNN has given us great testing accuracy. Grad-CAM was used as an XAI method on our CNN model, which gave us insights into the model and helped us detect the origin of interest for recognizing a digit from an image.

translated by 谷歌翻译

Jamdani Motif Generation using Conditional GAN

MD Tanvir Rouf Shawon , Raihan Tanvir , Humaira Ferdous Shifa , Susmoy Kar , Mohammad Imrul Jubair

分类：计算机视觉

2022-12-22

Jamdani is the strikingly patterned textile heritage of Bangladesh. The exclusive geometric motifs woven on the fabric are the most attractive part of this craftsmanship having a remarkable influence on textile and fine art. In this paper, we have developed a technique based on the Generative Adversarial Network that can learn to generate entirely new Jamdani patterns from a collection of Jamdani motifs that we assembled, the newly formed motifs can mimic the appearance of the original designs. Users can input the skeleton of a desired pattern in terms of rough strokes and our system finalizes the input by generating the complete motif which follows the geometric structure of real Jamdani ones. To serve this purpose, we collected and preprocessed a dataset containing a large number of Jamdani motifs images from authentic sources via fieldwork and applied a state-of-the-art method called pix2pix to it. To the best of our knowledge, this dataset is currently the only available dataset of Jamdani motifs in digital format for computer vision research. Our experimental results of the pix2pix model on this dataset show satisfactory outputs of computer-generated images of Jamdani motifs and we believe that our work will open a new avenue for further research.

translated by 谷歌翻译

A Prospective Approach for Human-to-Human Interaction Recognition from Wi-Fi Channel Data using Attention Bidirectional Gated Recurrent Neural Network with GUI Application Implementation

Md. Mohi Uddin Khan , Abdullah Bin Shams , Md. Mohsin Sarker Raihan

分类：机器学习 | 人工智能 | (统计)机器学习

2022-02-16

5G无线技术和社会经济转型的最新进展带来了传感器应用的范式转移。 Wi-Fi信号表明其时间变化与身体运动之间存在很强的相关性，可以利用这些变化来识别人类活动。在本文中，我们证明了基于时间尺度Wi-Fi通道状态信息的自由互助人与人类相互作用识别方法的认知能力。所检查的共同活动是稳定的，接近，离职的，握手的，高五，拥抱，踢（左腿），踢（右腿），指向（左手），指向（右手），拳打（左手），打孔（右手）和推动。我们探索并提出了一个自我发项的双向封盖复发性神经网络模型，以从时间序列数据中对13种人类到人类的相互作用类型进行分类。我们提出的模型可以识别两个主题对相互作用，最大基准精度为94％。这已经扩展了十对对象，该对象对围绕交互 - 转变区域的分类得到了改善，从而确保了88％的基准精度。同样，使用PYQT5 Python模块开发了可执行的图形用户界面（GUI），以实时显示总体相互交流识别过程。最后，我们简要地讨论了有关残障的可能解决方案，这些解决方案导致了研究期间观察到的缩减。这种Wi-Fi渠道扰动模式分析被认为是一种有效，经济和隐私友好的方法，可在相互的人际关系识别中用于室内活动监测，监视系统，智能健康监测系统和独立的辅助生活。

translated by 谷歌翻译

Modeling and Predicting Blood Flow Characteristics through Double Stenosed Artery from CFD simulation using Deep Learning Models

Ishat Raihan Jamil , Mayeesha Humaira

分类：机器学习

2021-12-04

建立针对双狭窄的动脉模型的计算流体动力学（CFD）的患者特异性有限元分析（FEA）模型涉及时间和努力，限制医生在时间关键时间医疗应用中快速响应的能力。这些问题可能通过培训深度学习（DL）模型来解决，以使用由具有不同配置的简化双韵动脉模型的CFD模拟产生的数据集来学习和预测血流特性。当通过从IVUS成像的实际双狭窄的动脉模型进行血液流动模式时，揭示了狭窄的颈部几何形状的正弦逼近，这些颈部几何形状被广泛用于先前的研究作品，未能有效地代表真实的效果收缩。结果，提出了一种收缩颈的新型几何表示，其就广义简化模型而言，这始终是前者的假设。动脉腔直径和流量参数的顺序变化沿着船长的长度呈现使用LSTM和GRU DL模型的机会。然而，对于短长度的倍增血液动脉的小数据集，基本神经网络模型优于大多数流动性质的专用RNN。另一方面，LSTM对预测具有大波动的流动性能更好，例如在血管的长度上变化血压。尽管在数据集中的船舶的所有属性训练和测试方面具有良好的整体准确性，但GRU模型在所有情况下为单个血管流预测的表现不佳。结果还指向任何模型中每个属性的单独优化的超级参数，而不是旨在通过单一的HyperParameters来实现所有输出的整体良好性能。

translated by 谷歌翻译

Prediction Model for Mortality Analysis of Pregnant Women Affected With COVID-19

Quazi Adibur Rahman Adib , Sidratul Tanzila Tasmi , Md. Shahriar Islam Bhuiyan , Md. Mohsin Sarker Raihan , Abdullah Bin Shams

分类：机器学习 | 人工智能

2021-11-22

Covid-19 Pandemic是一个持续的全球大流行，这导致了公共卫生部门和全球经济中的前所未有的中断。病毒，SARS-COV-2负责冠状病毒病的快速传播。由于其传染性，病毒可以容易地感染不受保护和暴露的个体，从轻度到严重症状。对怀孕母亲和新生儿的病毒效应的研究现在是平民和公共卫生工作者在全球范围内的关于病毒如何影响母亲和新生儿健康的问题。本文旨在制定一种预测模型，以估算基于记录的症状的携带型患者死亡的可能性：呼吸困难，咳嗽，鼻子，关节痛和肺炎的诊断。我们研究中使用的机器学习模型是支持向量机，决策树，随机林，渐变升压和人工神经网络。该模型提供了令人印象深刻的结果，可以准确地预测给定输入的怀孕母亲的死亡率。3型号（ANN，渐变升压，随机林）的精度率为100％，最高精度得分（梯度提升，ANN）是95 ％，最高召回（支持向量机）为92.75％，最高F1得分（梯度提升，ANN）为94.66％。由于模型的准确性，怀孕的母亲可以基于其由于病毒而导致的可能性即时治疗。全球卫生工人可以利用该模型列出急诊患者，最终可以降低Covid-19诊断患者的死亡率。

translated by 谷歌翻译

Predictive coding, precision and natural gradients

Andre Ofner , Raihan Kabir Ratul , Suhita Ghosh , Sebastian Stober

分类：机器学习 | 人工智能 | 神经与进化计算

2021-11-12

在机器学习中的局部更新规则和基于机器学习中的全局梯度的优化存在越来越大的融合。一种特别激励的连接是预测编码网络中本地知识优化与用于培训最先进的深层人工神经网络的错误反向验证算法之间的对应关系。在这里，我们专注于相关的预测编码网络中的精度加权与深神经网络的自然梯度下降算法之间的相关，但仍然很大程度上是探讨的联系。精确加权预测编码是一种有趣的候选者，用于缩放不确定性感知优化 - 特别是对于具有大参数空间的模型 - 由于其分布式性质以及渔民信息度量的底层局部近似，自适应学习自然梯度下降的速率。在这里，我们表明，具有学习精度的分层预测编码网络确实能够解决具有与天然梯度的全局反向化的性能相当的各种监督和无监督的学习任务，并且优于其经典梯度下降对应对方，其中嵌入了高量噪声的任务或标签输入。当应用于未经监视的图像输入的自动编码时，确定性网络产生分层组织和解散的嵌入，暗示在预测编码和分层变分或分化推理之间的密切连接处。

translated by 谷歌翻译